Bazı Unicode örnekleri (www.unicode.org ' dan alınmıştır) |
2.4.1.1 Ünikod (Unicode) Ünikod (unicode), metin tabanlı verilerin sayısal ortamda gösterilmesi ve bellekte tutulması için evrensel bir kodlama şeklidir ve ortaya çıkışının ana temeli Dünya üzerinde konuşulan/yazılan ulusal dillerden bağımsız ortak bir kodlama sisteminin gereksinimidir. Ünikod kodlama sisteminde herbir karakter bellekte 16 bit yer işgal eder; dolayısıyla bu genişletilmiş ASCII’nin iki katı büyüklüğündedir. Ünikod karakter kodlamasında herbir karaktere 16 bitlik birer kod verilmiştir. Yani, karakterler 16 bit uzunlukta yer işgal ederler; dolayısıyla 216’dan 65536 tane farklı karakter kodu olabilir. Klasik karakter kümeleri, genel olarak, aynı anda birkaç dili kotarabilecek şekildedir. Çoğu zaman dil değiştiğinde karakter kümesi de değiştirilir. Yani dil sorunu ortaya çıkar. En basitinden Internet’te dolaşırken dil yerleştirimden dolayı zaman zaman Türkçe karakterlerin doğru olarak görülmediği bilinmektedir. Dolayısıyla klasik karakter kümelerinde dil sorunu ortaya çıkmaktadır. Ünikod, olabilecek herbir karakter içi aynı kodlama sisteminin oluşmasını sağlamıştır. Eğer veriler Ünikod ile gösterilmişse/saklanmışsa verinin dili ne olursa olsun veriler kendi aralarında sıralanır, aranır ve her türlü işleme sokulabilir. Ünikod ile ana amaç, tek bir kodlama sistemiyle Dünyadaki tüm dilleri ve matematiksel simgeleri kodlayacak bir sistem ortaya çıkarılması ve böylece tam anlamıyla uluslararası yazılımların üretilmesidir. |